У нас есть Тошина разметка, что мы можем сказать интересного на ее основании? Там есть следующие названия столбцов:
## [1] "Sign" "H1 FingerSelection"
## [3] "H1 Aperture" "H1 Curve"
## [5] "H1 Bent" "H1 Facing"
## [7] "H1 Focus" "H1 Width"
## [9] "Dynamic Orientation" "Location"
## [11] "Plane" "Settings"
## [13] "Path" "H2 FingerSelection"
## [15] "H2 Aperture" "H2 Curve"
## [17] "H2 Bent" "H2 Width"
## [19] "H2 Facing" "H2 Focus"
## [21] "url" "file"
## [23] "labeled_url" "iconic"
## [25] "Anna_Klezovich_comments" "segment"
## [27] "manner_tense" "manner_repeated"
## [29] "manner_laceration" "manner_symmetrical"
## [31] "manner_alternating" "manner_biderectional"
## [33] "label"
Я хочу найти аутлайеров как среди точек, так и среди наблюдаемых значений. Построю MCA:
Вот точки:
Индексы I и II – это разные слова. Числа обозначают номер сегмента.
## Warning: Removed 6 rows containing missing values (geom_path).
## Warning: Removed 4 rows containing missing values (geom_path).
## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 3 rows containing missing values (geom_path).
## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 36 rows containing missing values (geom_path).
## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 2 rows containing missing values (geom_path).
## Warning: Removed 3 rows containing missing values (geom_path).
## Warning: Removed 1 rows containing missing values (geom_path).
## Warning: Removed 1 rows containing missing values (geom_path).
## Warning: Removed 1 rows containing missing values (geom_path).
## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 1 rows containing missing values (geom_path).
Что это за аутлайеры?
Вот переменные:
Чего-то справа торчат переменные, относящиеся к правой руке.
А вот все вместе:
Насколько важны все узлы?
Давай-ка выделим автоматически двуручные жесты:
Видно, что чем ось 1 отвечает за количество двуручных признаков в жесте.
А вторая ось отвечает за необычные признаки первой руки:
Хотя большинство жестов оутлайеров все же иконичны, надо отметить, что в основном центральном кластере они представлены достаточно равномерно.
Вот моя разметка, что мы можем сказать интересного на ее основании? Там есть следующие названия столбцов:
## [1] "Sign" "segment"
## [3] "url" "FingerSelection"
## [5] "Aperture" "Curve"
## [7] "Bent" "Width"
## [9] "Facing" "Focus"
## [11] "Dynamic Orientation" "Location"
## [13] "Plane" "Settings"
## [15] "Path" "Wiggle"
## [17] "H2 FingerSelection" "H2 Aperture"
## [19] "H2 Curve" "H2 Bent"
## [21] "H2 Width" "H2 Facing"
## [23] "H2 Focus" "H2 Dynamic Orientation"
## [25] "H2 Location" "H2 Plane"
## [27] "H2 Settings" "H2 Path"
## [29] "H2 Wiggle" "manner_tense"
## [31] "manner_repeated" "manner_laceration"
## [33] "manner_symmetrical" "manner_alternating"
## [35] "manner_biderectional" "file"
## [37] "labeled_url" "iconic"
## [39] "Anna_Klezovich_comments" "label"
Я хочу найти аутлайеров как среди точек, так и среди наблюдаемых значений. Построю MCA:
Вот точки:
Индексы I и II – это разные слова. Числа обозначают номер сегмента.
## Warning: Removed 10 rows containing missing values (geom_path).
## Warning: Removed 5 rows containing missing values (geom_path).
## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 4 rows containing missing values (geom_path).
## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 35 rows containing missing values (geom_path).
Не учитывается в MCA
## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 8 rows containing missing values (geom_path).
## Warning: Removed 5 rows containing missing values (geom_path).
## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 6 rows containing missing values (geom_path).
## Warning: Removed 3 rows containing missing values (geom_path).
## Warning: Removed 22 rows containing missing values (geom_path).
Не учитывается в MCA
Не используется в MCA
Что это за аутлайеры?
Вот переменные:
Чего-то справа торчат переменные, относящиеся к правой руке.
А вот все вместе:
Насколько важны все узлы?
Давай-ка выделим автоматически двуручные жесты:
Видно, что чем ось 1 отвечает за количество двуручных признаков в жесте.
Хотя большинство жестов оутлайеров все же иконичны, надо отметить, что, видимо, в обоих кластерах они представлены равномерно.